阿里通义万相新突破:静态图+音频,一键生成电影级数字人视频
阿里巴巴近日在AI视频生成领域再次迈出重要一步,其通义万相平台正式推出了全新多模态视频生成模型Wan2.2-S2V。这一创新技术使得用户仅凭一张静态图片和一段音频,就能生成面部表情自然、口型同步、动作流畅的电影级数字人视频。
阿里巴巴近日在AI视频生成领域再次迈出重要一步,其通义万相平台正式推出了全新多模态视频生成模型Wan2.2-S2V。这一创新技术使得用户仅凭一张静态图片和一段音频,就能生成面部表情自然、口型同步、动作流畅的电影级数字人视频。
在科技日新月异的今天,阿里巴巴再次引领技术潮流,正式推出了其通义万相平台的全新多模态视频生成模型——Wan2.2-S2V。这一创新模型仅需用户提供一张静态图片和一段音频,便能自动生成面部表情生动、口型精准匹配、肢体动作流畅的电影级数字人视频,为数字人直播、影视